智能论文笔记

Semi-Supervised Clustering via Dynamic Graph Structure Learning

Huaming Ling , Chenglong Bao , Xin Liang , Zuoqiang Shi

分类：机器学习

2022-09-06

大多数现有的半监督基于图的聚类方法通过完善亲和力矩阵或直接限制数据点的低维表示来利用监督信息。亲和力矩阵代表图形结构，对于半监督基于图的聚类的性能至关重要。但是，现有方法采用静态亲和力矩阵来学习数据点的低维表示，并且在学习过程中不会优化亲和力矩阵。在本文中，我们提出了一种新型的动态图结构学习方法，用于半监督聚类。在这种方法中，我们通过利用给定的成对约束来同时优化数据点的亲和力矩阵和低维表示。此外，我们提出了一种交替的最小化方法，并通过可靠的收敛来解决提出的非凸模型。在迭代过程中，我们的方法周期性地更新数据点的低维表示并完善了亲和力矩阵，从而导致动态亲和力矩阵（图结构）。具体而言，为了更新亲和力矩阵，我们强制使用具有明显不同的低维表示的数据点具有相关值为0。点。在不同设置下的八个基准数据集上的实验结果显示了所提出方法的优势。

translated by 谷歌翻译

PASTA-GAN++: A Versatile Framework for High-Resolution Unpaired Virtual Try-on

Zhenyu Xie , Zaiyu Huang , Fuwei Zhao , Haoye Dong , Michael Kampffmeyer , Xin Dong , Feida Zhu , Xiaodan Liang

分类：计算机视觉

2022-07-27

基于图像的虚拟试验是以人为中心的现实潜力，是以人为中心的图像生成的最有希望的应用之一。在这项工作中，我们迈出了一步，探索多功能的虚拟尝试解决方案，我们认为这应该具有三个主要属性，即，它们应支持无监督的培训，任意服装类别和可控的服装编辑。为此，我们提出了一个特征性的端到端网络，即用空间自适应的斑点适应性GAN ++（Pasta-gan ++），以实现用于高分辨率不合规的虚拟试验的多功能系统。具体而言，我们的意大利面++由一个创新的贴布贴片的拆卸模块组成，可以将完整的服装切换为归一化贴剂，该贴片能够保留服装样式信息，同时消除服装空间信息，从而减轻在未受监督训练期间过度适应的问题。此外，面食++引入了基于贴片的服装表示和一个贴片引导的解析合成块，使其可以处理任意服装类别并支持本地服装编辑。最后，为了获得具有逼真的纹理细节的尝试结果，面食gan ++结合了一种新型的空间自适应残留模块，以将粗翘曲的服装功能注入发电机。对我们新收集的未配对的虚拟试验（UPT）数据集进行了广泛的实验，证明了面食gan ++比现有SOTA的优越性及其可控服装编辑的能力。

translated by 谷歌翻译

PanGu-Coder: Program Synthesis with Function-Level Language Modeling

Fenia Christopoulou , Gerasimos Lampouras , Milan Gritta , Guchun Zhang , Yinpeng Guo , Zhongqi Li , Qi Zhang , Meng Xiao , Bo Shen , Lin Li

分类：机器学习 | 人工智能 | 自然语言处理

2022-07-22

我们提出了Pangu-Coder，这是一种仅预读的解码器语言模型，该模型采用pangu-alpha架构进行文本到代码生成，即给定自然语言问题描述的编程语言解决方案的合成。我们使用两阶段策略训练Pangu-Coder：第一阶段采用因果语言建模（CLM）来预先培训原始编程语言数据，而第二阶段则使用因果语言建模和掩盖语言建模（MLM）的组合培训目标，专注于文本到代码生成的下游任务，并培训松散的自然语言程序定义和代码功能。最后，我们讨论了pangu-coder-ft，该pander the是通过竞争性编程问题和代码与持续集成测试的结合进行了微调的。我们评估了pangu-coder，重点是它是否生成功能上正确的程序，并证明它在参加较小的上下文窗口和较少的数据培训的同时，它比诸如Codex之类的类似大小的模型（例如Codex）实现等效性或更好的性能。

translated by 谷歌翻译

BrainCog: A Spiking Neural Network based Brain-inspired Cognitive Intelligence Engine for Brain-inspired AI and Brain Simulation

Yi Zeng , Dongcheng Zhao , Feifei Zhao , Guobin Shen , Yiting Dong , Enmeng Lu , Qian Zhang , Yinqian Sun , Qian Liang , Yuxuan Zhao

分类：神经与进化计算

2022-07-18

尖峰神经网络（SNN）引起了脑启发的人工智能和计算神经科学的广泛关注。它们可用于在多个尺度上模拟大脑中的生物信息处理。更重要的是，SNN是适当的抽象水平，可以将大脑和认知的灵感带入人工智能。在本文中，我们介绍了脑启发的认知智力引擎（Braincog），用于创建脑启发的AI和脑模拟模型。 Braincog将不同类型的尖峰神经元模型，学习规则，大脑区域等作为平台提供的重要模块。基于这些易于使用的模块，BrainCog支持各种受脑启发的认知功能，包括感知和学习，决策，知识表示和推理，运动控制和社会认知。这些受脑启发的AI模型已在各种受监督，无监督和强化学习任务上有效验证，并且可以用来使AI模型具有多种受脑启发的认知功能。为了进行大脑模拟，Braincog实现了决策，工作记忆，神经回路的结构模拟以及小鼠大脑，猕猴大脑和人脑的整个大脑结构模拟的功能模拟。一个名为BORN的AI引擎是基于Braincog开发的，它演示了如何将Braincog的组件集成并用于构建AI模型和应用。为了使科学追求解码生物智能的性质并创建AI，Braincog旨在提供必要且易于使用的构件，并提供基础设施支持，以开发基于脑部的尖峰神经网络AI，并模拟认知大脑在多个尺度上。可以在https://github.com/braincog-x上找到Braincog的在线存储库。

translated by 谷歌翻译

Brain-inspired Graph Spiking Neural Networks for Commonsense Knowledge Representation and Reasoning

Hongjian Fang , Yi Zeng , Jianbo Tang , Yuwei Wang , Yao Liang , Xin Liu

分类：神经与进化计算 | 人工智能 | 机器学习

2022-07-11

人脑中的神经网络如何代表常识性知识，而完整的相关推理任务是神经科学，认知科学，心理学和人工智能的重要研究主题。尽管使用固定长度向量代表符号的传统人工神经网络在某些特定任务中取得了良好的表现，但它仍然是一个黑匣子，缺乏可解释性，远非人类对世界的看法。受神经科学中的祖母细胞假设的启发，这项工作调查了可以将编码和峰值定时依赖性可塑性（STDP）机制的人群整合到峰值神经网络的学习中，以及神经元的人群如何通过指导符号来指导符号在不同的神经元种群之间完成顺序触发。不同社区的神经元种群共同构成了整个常识知识图，形成了巨大的图形尖峰神经网络。此外，我们引入了奖励调节的峰值时间依赖性可塑性（R-STDP）机制，以模拟生物增强学习过程并相应地完成相关推理任务，比图形卷积人工神经网络实现了可比的准确性和更快的收敛速度。对于神经科学和认知科学领域，本文的工作为进一步探索人脑代表常识知识的方式提供了计算建模的基础。对于人工智能领域，本文通过构建常识性知识表示并推理具有固体生物学合理性的尖峰神经网络，指出了实现更健壮和可解释的神经网络的探索方向。

translated by 谷歌翻译

Online Reflective Learning for Robust Medical Image Segmentation

Yuhao Huang , Xin Yang , Xiaoqiong Huang , Jiamin Liang , Xinrui Zhou , Cheng Chen , Haoran Dou , Xindi Hu , Yan Cao , Dong Ni

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-01

当测试图像提出看不见的分布时，深层分割模型通常会面临故障风险。改善模型鲁棒性针对这些风险的鲁棒性对于深层模型的大规模临床应用至关重要。在这项研究中，受到人类学习周期的启发，我们提出了一个新颖的在线反思学习框架（REFSEG），以改善细分鲁棒性。基于启用概念的反射概念，我们的refseg首先驱动了深层模型以采取行动以获得语义分割。然后，refseg触发模型以反映自身。因为使深层模型在测试过程中意识到他们的细分失败是具有挑战性的，所以RefSeg合成了从语义面具中综合的逼真的代理图像，以帮助深层模型构建直观有效的反射。该代理翻译并强调了分割缺陷。通过最大程度地提高原始输入和代理之间的结构相似性，可以改善分割鲁棒性的反射循环。 REFSEG在测试阶段运行，并且是分割模型的一般性。通过公共心脏MR数据集和两个内部大型超声数据集对三个医疗图像细分任务进行了广泛的验证，这表明我们的refseg显着提高了模型的鲁棒性，并报告了与强大竞争对手有关的最先进的表现。

translated by 谷歌翻译

Weakly-supervised High-fidelity Ultrasound Video Synthesis with Feature Decoupling

Jiamin Liang , Xin Yang , Yuhao Huang , Kai Liu , Xinrui Zhou , Xindi Hu , Zehui Lin , Huanjia Luo , Yuanji Zhang , Yi Xiong

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-01

超声（US）广泛用于实时成像，无辐射和便携性的优势。在临床实践中，分析和诊断通常依赖于美国序列，而不是单个图像来获得动态的解剖信息。对于新手来说，这是一项挑战，因为使用患者的足够视频进行练习是临床上不可行的。在本文中，我们提出了一个新颖的框架，以综合高保真美国视频。具体而言，合成视频是通过基于给定驾驶视频的动作来动画源内容图像来生成的。我们的亮点是三倍。首先，利用自我监督学习的优势，我们提出的系统以弱监督的方式进行了培训，以进行关键点检测。然后，这些关键点为处理美国视频中的复杂动态动作提供了重要信息。其次，我们使用双重解码器将内容和纹理学习解除，以有效地减少模型学习难度。最后，我们采用了对抗性训练策略，并采用了GAN损失，以进一步改善生成的视频的清晰度，从而缩小了真实和合成视频之间的差距。我们在具有高动态运动的大型内部骨盆数据集上验证我们的方法。广泛的评估指标和用户研究证明了我们提出的方法的有效性。

translated by 谷歌翻译

Universal Learned Image Compression With Low Computational Cost

Bowen Li , Yao Xin , Youneng Bao , Fanyang Meng , Yongsheng Liang , Wen Tan

分类：计算机视觉

2022-06-23

最近，与传统标准（例如JPEG，JPEG2000和BPG）相比，学到的图像压缩方法已经迅速发展，并表现出出色的速率延伸性能。但是，基于学习的方法遭受了高计算成本的损失，这对在资源有限的设备上部署无济于事。为此，我们提出了换档 - 附加并行模块（SAPMS），包括用于编码器的SAPM-E和解码器的SAPM-D，以大大减少能源消耗。具体而言，可以将它们视为插入式播放组件，以升级现有的基于CNN的体系结构，与加法分支相比，Shift分支用于提取大颗粒功能。此外，我们彻底分析了潜图的概率分布，并建议使用拉普拉斯混合物的可能性以进行更准确的熵估计。实验结果表明，所提出的方法可以在PSNR和MS-SSSIM指标上与卷积对应物的相当甚至更好的性能，并减少2倍的能量。

translated by 谷歌翻译

Searching for Optimal Subword Tokenization in Cross-domain NER

Ruotian Ma , Yiding Tan , Xin Zhou , Xuanting Chen , Di Liang , Sirui Wang , Wei Wu , Tao Gui , Qi Zhang

分类：自然语言处理 | 人工智能

2022-06-07

输入分布转移是无监督域适应（UDA）中的重要问题之一。最受欢迎的UDA方法集中在域不变表示学习上，试图将不同域中的功能调整为相似的特征分布。但是，这些方法忽略了域之间的输入单词分布的直接对齐，这是单词级分类任务（例如跨域NER）的重要因素。在这项工作中，我们通过引入子词级解决方案X-Pience来为输入单词级分布移动，从而为跨域NER开发了新的灯光。具体而言，我们将源域的输入单词重新划分以接近目标子词分布，该分布是作为最佳运输问题制定和解决的。由于这种方法着重于输入级别，因此它也可以与先前的DIRL方法相结合，以进一步改进。实验结果表明，基于四个基准NER数据集的Bert-Tagger所提出的方法的有效性。同样，事实证明，所提出的方法受益于诸如Dann之类的DIRL方法。

translated by 谷歌翻译

Multi-task Deep Neural Networks for Massive MIMO CSI Feedback

Boyuan Zhang , Haozhen Li , Xin Liang , Xinyu Gu , Lin Zhang

分类：人工智能 | 机器学习

2022-04-18

深度学习已被广泛应用于频划分双工（FDD）中的通道状态信息（CSI）反馈，大量多输入多输出（MIMO）系统。对于反馈模型的典型监督培训，几乎无法满足大量特定于任务标记的数据的要求，并且在多种情况下，模型的巨大培训成本和存储使用是用于模型应用的障碍。在这封信中，提出了一种基于多任务学习的方法，以提高反馈网络的可行性。进一步提出了编码者共享的反馈体系结构和相应的培训计划，以促进实施多任务学习方法。实验结果表明，提出的多任务学习方法可以实现全面的反馈绩效，而反馈模型的培训成本和存储使用情况大大降低。

translated by 谷歌翻译